Ataques de caja negra, adaptativos y eficientes para romper LLMs
Nuevo ataque IHO vulnera LLMs incluso con defensas avanzadas. Evalúa robustez adversarial de forma eficiente y transferible. ¡Descúbrelo!
Nuevo ataque IHO vulnera LLMs incluso con defensas avanzadas. Evalúa robustez adversarial de forma eficiente y transferible. ¡Descúbrelo!